\section{线性变换的运算}

\begin{frame}{本节概要}
  \begin{enumerate}
    \item 令$P$-线性空间$V$上所有线性变换的集合为$L(V)$ 或 $\End(V)$. 
    我们将定义$L(V)$上的运算，这与第四章，第二节中讲到的矩阵的运算基本上是平行的。
    在下一节我们会把这种平行性精确化。
  \item 我们将定义$L(V)$上的加法、数乘，通过逐点定义的方式 (因为$V$上有加法和数乘)。
    加法和数乘得到的仍然是线性变换，并
      使得$L(V)$成为$P$-线性空间。还定义$L(V)$上的乘法，就是线性变换作为映射的乘法，也得到线性变换。
      $L(V)$上的加法、数乘、乘法有类似于矩阵的加法、数乘、乘法的性质。
    \item 另外，我们还会谈到线性变换的逆变换，线性变换的幂，线性变换的多项式。
  \end{enumerate}
\end{frame}

\begin{frame}{线性变换的线性运算（加法与数乘）}
  线性变换的线性运算是由其取值的线性运算诱导的。
  我们先来定义线性变换的加法。
  设 $\mathscr{A}, \mathscr{B}\in \End(V)$.
  定义它们的\emph{和} (sum) $\mathscr{A}+\mathscr{B}$ 为
\[
  (\mathscr{A}+\mathscr{B})( \alpha)=\mathscr{A}( \alpha)+\mathscr{B}( \alpha), \quad \text{对~} \alpha \in V .
\]

\begin{block}{线性变换加法的性质}
  \begin{enumerate}
    \item 线性变换的和还是线性变换\verify 。
    \item 线性变换的加法适合结合律与交换律，即
  \[
  \mathscr{A}+(\mathscr{B}+\mathscr{C})=(\mathscr{A}+\mathscr{B})+\mathscr{C}, \quad \mathscr{A}+\mathscr{B}=\mathscr{B}+\mathscr{A} .
  \]
\item 零变换 $\symscr{O}$ 在线性变换的加法中有着特殊的地位，它扮演的角色如同数的加法中$0$的角色（所以$\sO$也常写作$0$）:
它与所有线性变换 $\mathscr{A}$ 的和仍等于 $\mathscr{A}$, 即
$
\mathscr{A}+\sO=\mathscr{A} .
$

\item   对于每个线性变换 $\mathscr{A}$,我们可以定义它的\emph{负变换} (negative, the negative transformation) $-\mathscr{A}$ :
\[
  (-\mathscr{A})(\alpha)=-\mathscr{A}(\alpha), \quad \text{对}~ \alpha \in V .
\]
容易看出，负变换 $-\mathscr{A}$ 也是线性的，且
$
\mathscr{A}+(-\mathscr{A})=\symscr{O} .
$
  \end{enumerate}
\end{block}
\end{frame}

\begin{frame}


  接着我们来定义线性变换的数乘。对$k\in P$和$\sA\in \End(V)$, 定义\emph{数量乘法} (scalar multiplication) $k\sA$为
\[
  (k\sA)(\alpha)= k\sA(\alpha),  \quad \text{对}~ \alpha \in V .
\]
在上一节中我们看到， 数域 $P$ 中每个数 $k$ 都决定一个数乘变换 $\mathscr{K}$. 
显然$k\sA= \sK \sA$.

\begin{block}{数乘的性质}
$k \mathscr{A}$ 还是线性变换。而且，线性变换的数量乘法适合以下规律：
对任意的$k, l\in P$, $\sA, \sB\in \End(V)$,
\[
  \begin{aligned}
    (k l) \mathscr{A}&= k(l \mathscr{A}), &&  \text{（结合律）} \\
    (k+l) \mathscr{A}&= k \mathscr{A}+l \mathscr{A}, && \text{（分配律）} \\
    k(\mathscr{A}+\mathscr{B})&= k \mathscr{A}+k \mathscr{B}, && \text{（分配律）}\\
    1 \mathscr{A}&= \mathscr{A}. &&\text{（$1\in P$的作用是恒等作用）}
\end{aligned}
\]
\end{block}

由加法与数乘的性质可知，线性空间 $V$ 上全体线性变换构成的集合$\End(V)$, 
对于如上定义的加法与数量乘法， 
也构成数域 $P$ 上一个线性空间。

\end{frame}


\begin{frame}{线性变换的乘法}

线性空间的线性变换的乘法按定义就是作为映射的乘法（即复合）。 
设 $\mathscr{A}, \mathscr{B}\in \End(V)$ 是线性空间 $V$ 的两个线性变换，它们的乘积 $\symscr{A} \mathscr{B}$ 定义为
\[
  \mathscr{A} \mathscr{B}\colon V\rightarrow V, \quad  \alpha\mapsto \mathscr{A}(\mathscr{B}( \alpha)).
\]

\begin{block}{线性变换乘法的性质}
  \begin{enumerate}
    \item 线性变换的乘积也是线性变换。 事实上，对任意的$\alpha, \beta\in V$和$k, l\in P$, 我们有
      \[
        \begin{aligned}
          (\mathscr{A} \mathscr{B})(k \alpha+l \beta)&= \mathscr{A}(\mathscr{B}(k \alpha+l \beta))
          = \mathscr{A}(k\mathscr{B}( \alpha)+l\mathscr{B}( \beta)) \\
          &= k \mathscr{A}(\mathscr{B}( \alpha))+ l \mathscr{A}(\mathscr{B}( \beta)) \\
          &=   k (\mathscr{A} \mathscr{B})( \alpha)+ l(\mathscr{A} \mathscr{B})( \beta).
  \end{aligned}
\]
\item 线性变换的乘法满足结合律，即
$
  (\mathscr{A} \mathscr{B}) \mathscr{C}=\mathscr{A}(\mathscr{B} \mathscr{C}),
$
因为映射的乘法适合结合律。
\item 恒等变换（单位变换）在乘法中享有特殊的地位，它扮演的角色如同数的乘法中的$1$的角色（所以$\sE$也常写为$1$）：
  对于任意线性变换 $\mathscr{A}$,都有
  \[
  \mathscr{E} \mathscr{A} =\mathscr{A} =\mathscr{A} \mathscr{E} .
\]
\end{enumerate}
\end{block}

\end{frame}

\begin{frame}
  \begin{block}{线性变换乘法的性质}
  \begin{enumerate}
      \setcounter{enumi}{3}
\item 和矩阵的运算一样，线性变换的乘法与线性运算有相容性。
  线性变换的乘法对加法有分配律，即
\[
\mathscr{A}(\mathscr{B}+\mathscr{C})=\mathscr{A} \mathscr{B}+\mathscr{A}\sC, \quad(\mathscr{B}+\mathscr{C}) \mathscr{A}=\mathscr{B} \mathscr{A}+\mathscr{C} \mathscr{A} .
\]
如左边的分配律可如下验证：
\[
\begin{aligned}
(\mathscr{A}(\mathscr{B}+\mathscr{C}))(\alpha) & =\mathscr{A}((\mathscr{B}+\mathscr{C})(\alpha))=\mathscr{A}(\mathscr{B}(\alpha)+\mathscr{C}(\alpha)) \\
& =\mathscr{A}(\mathscr{B}(\alpha))+\mathscr{A}(\mathscr{C}(\alpha))=(\mathscr{A} \mathscr{B})(\alpha)+(\mathscr{A} \mathscr{C})(\alpha)\\
&= (\mathscr{A} \mathscr{B}+\mathscr{A} \mathscr{C})(\alpha) .
\end{aligned}
\]
线性变换的乘法与数乘有结合律：
\[
  k(\sA\sB)=(k\sA)\sB=\sA(k\sB).
\]
\end{enumerate}
\end{block}

\begin{remark*}
  线性变换的乘法一般不可交换。例如，实线性空间 $\bR[x]$ 上线性变换
  \[
    \mathscr{D}(f(x))=f^{\prime}(x), \quad \mathscr{I}(f(x))=\int_{0}^{x} f(t) \diff t
\]
的乘积 $\symscr{D} \mathscr{I}=\mathscr{E}$, 但一般 $\mathscr{I} \mathscr{D} \neq \mathscr{E}$.
\end{remark*}
\end{frame}

\begin{frame}{可逆的线性变换}
  \begin{definition}
    $V$ 的变换 $\mathscr{A}$ 称为\emph{可逆}的 (invertible)，如果有 $V$ 的变换 $\mathscr{B}$ 存在，使
    \[
    \mathscr{A} \mathscr{B}=\mathscr{B} \sA=\mathscr{E} .
    \]
    这时，变换 $\mathscr{B}$ 称为 $\mathscr{A}$ 的\emph{逆变换} (inverse, inverse transformation)， 记为 $\mathscr{A}^{-1}$. 
\end{definition}

我们知道一个映射可逆相当于其为双射。因此可逆的线性变换也正是既是双射又线性的变换，
或者说，这个变换是个同构。在上一章我们讲过，同构的逆映射也是同构。
特别地，如果线性变换 $\mathscr{A}$ 是可逆的，那么它的逆变换 $\mathscr{A}^{-1}$ 也是线性变换。 


设$V$有限维。在下一节，我们将看到可逆的线性变换对应于可逆矩阵。对于方阵$A$, 
我们知道，只要存在方阵$B$使得$AB=E$或$BA=E$即可知$A$可逆。
与之相应地，只要存在变换$\sB$使得
$\mathscr{A} \mathscr{B}=\sE$或$\mathscr{B} \sA=\mathscr{E},$ 
则$\sA$可逆 (注意到此时仍有$\sB$自动线性)。

%\begin{observation*}
%  如果线性变换 $\mathscr{A}$ 是可逆的，那么它的逆变换 $\mathscr{A}^{-1}$ 也是线性变换。 
%\end{observation*}
%\begin{proof}
%  实际上，对$\alpha, \beta\in V$和$k,l\in P$有
%  \begin{align*}
%    \sA\left( \sA^{-1}(k \alpha+ l \beta) \right)&=  k\alpha + l \beta 
%    = k \sA \sA^{-1}(\alpha) + l\sA \sA^{-1}(\beta) \\
%    &= \sA\left( k \sA^{-1}(\alpha) + l \sA^{-1}(\beta) \right).
%  \end{align*}
%  既然$\sA$是单射，我们有
%  \[
%    \sA^{-1}(k \alpha+ l \beta)=k \sA^{-1}(\alpha) + l \sA^{-1}(\beta).
%  \]
%  这样$\sA^{-1}$是线性变换。
%\end{proof}

\end{frame}

\begin{frame}{线性变换的幂}
既然线性变换的乘法满足结合律， 当若干个线性变换 $\mathscr{A}$ 重复相乘时， 其最终结果是完全确定的， 与乘积的结合方法无关。 
因此当 $n$ 个 ( $n$ 是正整数) 线性变换 $\mathscr{A}$ 相乘时，我们就可以用
\[
  \overbrace{\mathscr{A} \mathscr{A} \cdots \mathscr{A}}^{n \text{个}}
\]
来表示， 称为 $\mathscr{A}$ 的 \emph{$n$ 次幂} ($n$-th power)， 简单地记作 $\mathscr{A}^{n}$. 此外， 作为定义， 令
\[
\mathscr{A}^{0}=\mathscr{E} .
\]
根据线性变换幂的定义，可以推出指数法则：
\[
\mathscr{A}^{m+n}=\mathscr{A}^{m} \mathscr{A}^{n}, \quad\left(\mathscr{A}^{m}\right)^{n}=\mathscr{A}^{m n}, \quad m, n \geqslant 0 .
\]
当线性变换 $\mathscr{A}$ 可逆时，定义 $\mathscr{A}$ 的负整数幂为
\[
\mathscr{A}^{-n}=\left(\mathscr{A}^{-1}\right)^{n}, \quad n \text { 是正整数。 }
\]
这时，指数法则可以推广到负整数幂的情形。

值得注意的是， 线性变换乘积的指数法则不成立（因为乘积的不交换性）， 即一般说来
\[
  (\mathscr{A} \symscr{B})^{n} \neq \mathscr{A}^{n} \mathscr{B}^{n} .
\]

\end{frame}

\begin{frame}{线性变换的多项式}
\emph{线性变换$\sA\in \End(V)$的多项式} (polynomial of $A$) 指$\sA$的（非负整数次）幂的线性组合得到的线性变换，即$\sA$的多项式形如
\[\tag{$*$}
  a_{m} \mathscr{A}^{m}+a_{m-1} \mathscr{A}^{m-1}+\cdots+a_{0} \mathscr{E}, \quad\text{其中$a_i\in P$}.
\]
令
\[
  f(x)=a_mx^m + a_{m-1}x^{m-1}+\cdots a_0\in P[x]. 
\]
那么 ($*$) 可以记为 $f(\sA)$, 这是视其为把$\sA$替换$f(x)$中的$x$得到的线性变换。

~

$f(x)\mapsto f(\sA)$ 称为\emph{把$\sA$代入多项式$f(x)$} (substitution) 或\emph{赋值$x=\sA$} (evaluation), 由此定义的映射
\[
  P[x]\rightarrow P[\sA],\quad f(x) \mapsto f(\sA)
\]
称为\emph{赋值同态} 
\footnote{环同态 $P[t]\rightarrow P[\sA]\subset \End(V)$ 提供了线性变换的$P[t]$-模结构观点。实际上，$P$-向量空间上的线性算子与$P[x]$-模是等价的概念：给定$P$-向量空间上的一个线性算子相当于给定该空间上的一个$P[t]$-模结构。要了解到此观点的应用，可参见~\cite[第 14 章]{Art12}.
如此，后面谈到的$\sA$-不变子空间就相当于子模，而空间分解为$\sA$-子空间的直和就相当于该模分解为子模的直和。}
(evalution map, evaluation homomorphism)，其中$P[\sA]$为$\sA$的多项式的集合（这是$\End(V)$的子集）。此映射显然是个满射。
\end{frame}


\begin{frame}
不难验证，上述赋值与加法、乘法是相容的
（指``先做多项式的加法或乘法再代入线性变换''跟``先代入再做线性变换的加法或乘法''的结果一样）。
具体说来就是，
%如果在 $P[x]$ 中，
%\[
%h(x)=f(x)+g(x), \quad p(x)=f(x) g(x),
%\]
%那么
%\[
%h(\mathscr{A})=f(\mathscr{A})+g(\mathscr{A}), \quad p(\mathscr{A})=f(\mathscr{A}) g(\mathscr{A}) .
%\]
%\pause
%简单点写就是：
\[
  (f+g)(\sA)=f(\sA)+g(\sA), \quad (fg)(\sA)=f(\sA)g(\sA).
\]
特别地，同一个线性变换的多项式的乘法是可交换的，即
\[
f(\mathscr{A}) g(\mathscr{A})=g(\mathscr{A}) f(\mathscr{A}) .
\]
我们只验证下乘法相关的等式。令
$%\[
  f=\sum_{i=0}^n a_i x^i, \quad g=\sum_{j=0}^m b_j x^j.
$%\]
那么根据多项式的运算律（特别强调下分配律）我们有
\[
  fg=\sum_{i=0}^n\sum_{j=0}^m a_ib_j x^{i+j}.
\]
从而
\[
  (fg)(\sA)=\sum_{i=0}^n\sum_{j=0}^m a_ib_j \sA^{i+j}.
\]
另一方面，根据线性变换的运算律（特别强调下分配律）我们有
\[
  f(\sA)g(\sA)=\left( \sum_{i=0}^n a_i \sA^i \right) \left( \sum_{j=0}^m b_j \sA^j \right) = \sum_{i=0}^n\sum_{j=0}^m a_ib_j \sA^{i+j}.
\]
这样的确有$(fg)(\sA)=f(\sA)g(\sA)$.
\end{frame}


\begin{frame}
下面的例子表明，线性变换之间的一些关系可以通过线性变换的运算表示出来。
\begin{example}
在三维几何空间中，对于某一非零向量 $\alpha$ 的内射影 $\Pi_{\alpha}$ 是一个线性变换。
我们解释过 $\Pi_{\alpha}$ 的公式为 
\[
  \Pi_{\alpha}(\zeta)=\frac{\pair{ \alpha, \zeta}}{\pair{\alpha, \alpha}} \alpha
\]
其中 $\pair{\alpha, \zeta},\pair{\alpha, \alpha}$ 表示向量的点积。

从图 2 不难看到， $\zeta$ 在以 $ \alpha$ 为法向量的平面 $x$ 上的内射影 $\Pi_{x}(\zeta)$ 可以用公式
\[
\Pi_{x}(\zeta)=\zeta-\Pi_{\alpha}(\zeta)
\]
表示。 因此
\[
\Pi_{x}=\mathscr{E}-\Pi_{\alpha},
\]
这里 $\mathscr{E}$ 是恒等变换。
$\zeta$ 对于平面 $x$ 的反射 $\mathscr{R}_{x}$ 也是一个线性变换， 它的像 (图 2) 由公式
\[
\mathscr{R}_{x}(\zeta)=\zeta-2 \Pi_{\alpha}(\zeta)
\]
给出。 因此
\[
  \symscr{R}_{x}=\mathscr{E}-2 \Pi_{\alpha} .
\]
设 $ \alpha,  \beta$ 是空间的两个非零向量。 易知 $ \alpha$ 与 $ \beta$ 互相垂直的充分必要条件为
$\Pi_{\alpha} \Pi_{\beta}=0$. 诚然，注意到 $\Pi_{\alpha}\Pi_{\beta}(\zeta)=\frac{\pair{\alpha,\beta}}{\pair{\alpha,\alpha}} \frac{\pair{\beta,\zeta}}{\pair{\beta,\beta}} \alpha$, 
因此$\Pi_{\alpha}\Pi_{\beta}=0$当且仅当 $\pair{\alpha, \beta}=0$ 当且仅当$\alpha\perp \beta$. 
\end{example}

\end{frame}

\begin{frame}{}

  \begin{figure}[h]
    \centering
    \begin{tikzpicture}[yscale=.6]
      \coordinate (parellelogram0) at (0,0);
      \coordinate (parellelogram1) at (4,0);
      \coordinate (parallelogram2) at (5,2);
      \coordinate (parallelogram3) at (1,2);
      \shadedraw[->, thick, left color=green!10, right color=green!60, draw=green] (parellelogram0) -- (parellelogram1) -- (parallelogram2) -- (parallelogram3) -- cycle;
      \node[above right,xshift=.8em] at (parellelogram0) {$x$};
      \coordinate (O) at (1.5,0.8); 
      \coordinate[label=left:$\alpha$] (A) at (1.5,1.8);
      \coordinate[label=left:$\Pi_{\alpha}(\zeta)$] (P) at (1.5,2.8);
      \coordinate[label=right:$\zeta$] (Z) at (3.5,2.8);
      \coordinate[label=right:$\Pi_x(\zeta)$] (Px) at (3.5,0.8);
      \coordinate[label=right:$\sR_x(\zeta)$] (R) at (3.5,-1.2);
      \draw[thick,->,blue] (O) -- (A);
      \draw[thick,->,magenta] (A) -- (P);
      \draw[thick,->,magenta] (O) -- (Z);
      \draw[thick,->,magenta] (O) -- (Px);
      \path[name path=bottom] (parellelogram0) -- (parellelogram1);
      \path[name path=l] (O) -- (R);
      \draw[name intersections={of=bottom and l, by=point},thick,->,magenta]
      (point) -- (R);
      \draw[magenta,dashed,thick] (O) -- (point);
      \draw[dashed] (P) -- (Z) -- (R);
    \end{tikzpicture}
    \caption*{图 2}
    \label{0F4}
  \end{figure}
\begin{example}
  考虑线性空间 $P[\lambda]_{n}$. 求微商$\symscr{D} \colon f\mapsto f'$是一个线性变换，满足
  $
   \mathscr{D}^{n}=0 .
  $
 其次，平移
  \[
   \mathscr{S}_{a}\colon f(\lambda) \mapsto f(\lambda+a)
  \]
 也是一个线性变换。 回忆下我们有泰勒展开式
  \[
   f(\lambda+a)=f(\lambda)+a f^{\prime}(\lambda)+\frac{a^{2}}{2 !} f^{\prime \prime}(\lambda)+\cdots+\frac{a^{n-1}}{(n-1) !} f^{(n-1)}(\lambda),
  \]
 因此 $\mathscr{S}_{a}$ 实质上是 $\mathscr{D}$ 的多项式：
  \[
   \mathscr{S}_{a}=\mathscr{E}+a \mathscr{D}+\frac{a^{2}}{2 !} \mathscr{D}^{2}+\cdots+\frac{a^{n-1}}{(n-1) !} \mathscr{D}^{n-1} .
  \]
\end{example}
\end{frame}

\begin{frame}{小结}
  \begin{enumerate}
    \item 我们定义了线性变换的哪些运算？有哪些性质？可类比于方阵的运算及其性质想想（后面我们会知道这不是简单的类比，有更丰富的数学含义。）
  \end{enumerate}
\end{frame}
